查看原文
其他

这几个AI算法,我能玩一天!

Jack Cui Jack Cui 2022-07-26

大家好,我是 Jack~

2022 年的 CVPR 论文在月初就放榜了,共有 2067 篇论文被接收。

今天,给大家介绍几个,其中刚刚开源的几个好玩算法。

DualStyleGAN

高分辨率的肖像风格迁移算法DualStyleGAN

给定一张真人图片A

图片A

再给一张图片B,就是要变换的风格:

图片B

算法会将图片A根据图片B的风格进行风格迁移,生成图片C

图片C

这个效果还不错吧?

这样我们就可以根据自己喜欢的动漫角色,对自己的肖像进行风格迁移了。

一起看下更多的算法效果:

第一列原始图像,第二列参考的风格,第三列算法生成的效果。

这个算法,可以应用到一些有头像需求的场景,提供用户一些可选的漫画风格,生成自己喜欢的肖像。

DualStyleGAN算法刚刚开源,已获得近300的star。

项目地址:

https://github.com/williamyang1991/DualStyleGAN

算法运行官方提供了三种方法。

没有任何编程基础的小伙伴,可以体验 Web 网页。

https://huggingface.co/spaces/hysts/DualStyleGAN

上传图片即可体验。

另外两种就是 Colab 环境和本地搭建。

Colab 不需要自己安装一些第三方依赖,有“梯子”可以直接打开运行。

https://colab.research.google.com/github/williamyang1991/DualStyleGAN/blob/master/notebooks/inference_playground.ipynb

想本地测试的小伙伴也可以本地部署,官方提供了 Conda 的环境,直接创建一个虚拟环境即可。

conda env create -f ./environment/dualstylegan_env.yaml

详细的内容,各位小伙伴直接看README吧。

最后再放一组惊艳的效果。

RQ-VAE Transformer

经常看我文章的小伙伴,应该看过我写的 NÜWA(女娲)、DALL-E 算法。

今天要介绍的算法RQ-VAE Transformer在文字转图片任务上效果更好。

任务就是根据一段文字描述,生成对应描述的图片。

比如:

A cheeseburger in front of a mountain range covered with snow.

雪山前的芝士汉堡。

算法根据我们的文字描述,生成对应的图片。

再比如:

a cherry blossom tree on the blue ocean.

蓝色海洋上盛开的樱花树。

算法主要分为两个阶段:RQ-VAE 和 RQ-Transformer。

前者负责编码,后者负责生成。

算法也是刚刚开源:

项目地址:

https://github.com/kakaobrain/rq-vae-transformer

本项目只支持本地环境,第三方库可以直接根据requirements进行安装。

pip install -r requirements.txt

大家可以去体验下,有些效果挺有意思。

VFD

DeepFake 换脸技术越来越多。

换脸的图片和视频都太逼真了,有时候肉眼很难判断。

VFD通过技术手段,可以帮助我们分析图片的真假。

它也是 2022 年的 CVPR,刚刚开源。

至于效果,大家就自行测试吧。

项目地址:

https://github.com/xaCheng1996/VFD

絮叨

从 2022 年的 CVPR 来看,3D 重建相关的,还有 Transformer 的内容,一直挺多。

后面看情况再分享一些 3D 重建的吧。

本文有用的话,来个赞喽~

我是 Jack,我们下期见!

·················END·················

推荐阅读

•   北大CS,这样上!•   健身环爆打老头环,已开源!•   兄弟们,人麻了

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存